iT邦幫忙

2025 iThome 鐵人賽

DAY 2
2

方法論基礎(Methodology)概要

這個大類別的設計邏輯是:從簡單到複雜、從描述到預測、從單變項到多變項、從統計檢驗到機器學習
先用統計方法分析基礎現象,逐步引入迴歸、生存分析,再到決策樹、隨機森林、支持向量機等 AI 方法,最後用結構方程模型整合因果與路徑。這樣的設計能讓健康與社會研究兼具可解釋性(explainability)與預測力(predictive power)

1. 描述統計(Descriptive Statistics)

  • 專有名詞解釋:用來呈現資料的基本特徵,如平均數、中位數、標準差、比例。

  • 緣由:在健康研究中,先了解受試者的年齡、教育、收入分布,才能掌握研究背景。

  • 例子:比較不同教育程度的長者平均 BMI,或呈現婚姻狀態的比例。

2. 推論統計(Inferential Statistics)

  • 專有名詞解釋:用抽樣資料來檢驗群體差異,例如 t-test、ANOVA。

  • 緣由:檢驗教育程度或收入是否與體適能有顯著差異。

  • 例子:用 ANOVA 比較「高收入、中收入、低收入」三組長者的握力差異。

3. 交叉分析(Cross Tabulation)

  • 專有名詞解釋:檢視兩個類別變項的交互關係。

  • 緣由:婚姻與居住狀態可能交互影響健康行為。

  • 例子:單身獨居 vs. 已婚同住 → 規律運動比例的差異。

4. 多元迴歸分析(Multiple Regression)

  • 專有名詞解釋:探討多個自變項對一個連續依變項的影響。

  • 緣由:教育與收入同時影響體適能,需要控制混雜因子。

  • 例子:教育、收入、年齡對 6 分鐘步行測驗距離的影響。

5. 邏輯迴歸(Logistic Regression)

  • 專有名詞解釋:用於二元結果(yes/no)的機率預測。

  • 緣由:預測長者是否有慢性病風險。

  • 例子:以運動習慣、教育收入預測「是否患有高血壓」。

6. Cox 生存分析(Cox Proportional Hazards Model)

  • 專有名詞解釋:分析「事件發生時間」與風險因子的關係。

  • 緣由:研究居住狀態與長照需求出現的時間差異。

  • 例子:獨居長者 vs. 同住長者 → 進入長照機構的平均年限差異。

7. 決策樹(Decision Tree)

  • 專有名詞解釋:用樹狀結構依規則分群。

  • 緣由:易於解釋,能直觀呈現影響健康的路徑。

  • 例子:教育程度 + 運動習慣 → 體適能高低分類。

8. 隨機森林(Random Forest)

  • 專有名詞解釋:整合多棵決策樹提升準確率的集成學習方法。

  • 緣由:用於辨識體適能影響的關鍵因子,避免單一決策樹的偏差。

  • 例子:判斷因子,誰最影響握力。

9. 支持向量機(Support Vector Machine, SVM)

  • 專有名詞解釋:一種分類方法,尋找最佳超平面分隔不同群體。

  • 緣由:區分婚姻狀態下的健康與不健康群組。

  • 例子:輸入 BMI、運動頻率、教育 → 分群「健康 vs. 不健康」。

10. 結構方程模型(Structural Equation Modeling, SEM)

  • 專有名詞解釋:結合迴歸與因子分析,探討多重因果路徑。

  • 緣由:教育收入可能同時影響體適能,也透過「運動習慣」間接影響。

  • 例子:教育 → 運動習慣 → 體適能;收入 → 健康資源 → 體適能。

總結設計邏輯

這個方法論基礎大類別是循序漸進的:

  1. 基礎描述(了解現況)

  2. 統計檢驗(驗證差異)

  3. 迴歸與生存分析(探討因果與時間)

  4. 機器學習(分類與預測)

  5. 整合模型(建構多重路徑)

它能兼顧「實證研究」與「預測應用」,並對健康與社會變項的交互關係提供清楚分析路徑。


上一篇
AI 與統計在醫療與長照決策中的應用
系列文
AI 與統計在醫療與長照的應用:連結教育、收入、婚姻與居住,建構健康與照護決策支持2
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言